老基因查询
如果我研究的基因是其他人已经研究很深入的基因了,一般都会有人去做其细胞定位的。这个时候我们可以使用 RNALocate (http://www.rna-society.org/rnalocate/)进行查询。这个数据库通过文本挖掘的方式,来挖掘了已经有研究报道的基因定位。
这个数据库提供了检索的功能,我们只需要提供相关的基因名就可以来检索到结果了。
通过检索,我们就可以得到这个基因目前研究定位的具体结果了。如果有结果的话,数据库会把相关的句子列出来,来证明其文章挖掘的正确性。同时如果这个定位结果来自于数据库,也会把数据库的信息列出来。
需要注意的是,这个数据库是2017发表的。所以关于基因定位的信息也就收集到17年之前,近3年的基因研究结果就没有包含在内了。
新基因查询
RNALocate 的数据的。由于在 RNALocate 已经知道了很多lncRNA的定位了,所以基于这些RNA的定位的序列,来进行机器学习,并获得一个相关的模型,进而对输入的基因序列来进行位置预测。
如果我们研究的基因是新的基因的话,那就不能通过上面的数据库来进行查询了,就只能通过预测来做了。目前对于定位预测的方式主要还是基于基因序列的。下面介绍的两个预测数据库也是基于上面
所以,这两个数据库我们只需要数据目标序列就行。两个数据库的差别其实也就是算法的不同而已。
lncLocator
(其中第二步邮箱只是为了保存数据结果,以后查看更方便,这里暂时不选择了)
iLoc-LncRNA
iLoc-LncRNA 也是一样,